在 Ubuntu 20.04 里装设 ibus

您所在的位置:网站首页 rime 日语方案 在 Ubuntu 20.04 里装设 ibus

在 Ubuntu 20.04 里装设 ibus

2024-06-30 08:43| 来源: 网络整理| 查看: 265

Ping-Wu 写了: ↑2020-07-06 6:23 ibus-rime 有 60个干支供选择。 我们应该可以把 rime 里的预设词库(繁体中文)换掉。 因为档案太大了,不好编辑。可以用……的方式补到前面 dict.yaml 档案的屁股后面,即可。 我的“单手笔顺输入法”核心词库的“数学算术”分类里,也包含有 60 个干支,还有 64 卦呢。 需要注意的是,在Windows系统下Rime对词库文件的大小有限制,太大无法生效,最好不要超过85M(或100M),太大的词库文件需要拆分成几个子词库文件。Linux系统下Rime词库文件的大小没有限制,一个就行。

关于港台的词库,繁简转换是小事,更大的问题是:两岸三地很多词汇的写法不一样,例如:网络——網路,奔驰车——平治車,这不是繁简转换能解决的。我目前收集有几个G的大陆网友词库,几千万条,但有很多词汇是重复的、生僻的、超长的、胡乱自造的、有错别字的、恶意骂人的,淫秽的,必须想办法剔除这些词语。

在我把“单手笔顺输入法”的单字码表 2.0 版修正完成后,我就会处理这些词库。目前的想法是(我能做到的):用Python脚本剔除重复项,筛选出2~7字的词汇,尽量(根据已有的列表)排除一部分错别字词汇和不良词汇,剩下的只能靠人工浏览挑选/剔除了,工作量不是一般的大。——之前曾想过借用sogou,baidu、QQ输入法内置的“核心词库”,但都是加密防止被别入窃用的。好不容易找到一个旧版破解了的,结果打开一看,里面尽是XX汽车、XX房产、XX游戏的名称,常用的词语反而少之又少,于是放弃。

如果能找到类似《现代汉语词典》的电子版词库(可复制粘贴),那就规范、方便、省事多了。 百度文库有网友上传的《现代汉语常用词表(草案)》和《现代汉语常用词汇表》,但需要VIP会员才能下载。 (还好,我可以一页一页慢慢复制……两本书才一二百页而已嘛。) 影印版的PDF文件 http://www.moe.gov.cn/ewebeditor/upload ... 920115.pdf

之前也是,我想找“一二三级汉字”即《通用规范汉字表》,于是去政府网站: 国家语言文字工作委员会 http://www.moe.gov.cn/jyb_sy/China_Language/ ——语言文字信息管理司 http://www.moe.gov.cn/s78/A19/ ——语言文字规范标准——《通用规范汉字表》.pdf http://www.moe.gov.cn/s78/A19/yxs_left/ ... 86002.html 国务院关于公布《通用规范汉字表》的通知——国发〔2013〕23 号 http://www.gov.cn/zhengce/content/2013- ... t_1289.htm 但下载的是影印版的PDF文件,而且编排方式不利于提取所有单字。

然后“百度文库”里倒是有网友提取了单字的doc文件,但是需要“2下载券”! 晕~~~“2下载券”值几分钱?能拉来几个(被迫加入的)新用户? 这么积阴德的事,反而自己给自己设置障碍? 积阴德有什么用? ——汉语拼音发明人周有光,没有发大财,他活了112岁! ——邵逸夫是有钱的大老板,生活条件没得说,在全国各地盖了那么多教学楼,也积了不少阴德,活了107岁,即使如此,仍比周有光少活了5年。 没发财活那么久有什么用? ——周有光是2017年去世的,如果他只活到100岁就没见过智能手机;如果他只活到90岁就没上过互联网;如果他只活到80岁就没碰过电脑;如果他只活到70岁……人生70古来稀……既发不了大财,也活不到70岁,那岂不是更亏?积阴德比发大财容易多了。

话说回头,诸如: 规范标准的中文汉语字体——应该公布免费电子版,让公众知晓八万汉字每一个的正确写法。有很多“非艺术化”字体里的字,并没有按国标GB13000.1笔画规范来书写,写成了另一个形状。包括谷歌的开源字体也有很多错误。 规范标准的中文汉语词库——应该公布免费电子版,并责令商业输入法在网友错误输入时自动更正。拼音输入法里各种谐音带错别字的词汇,数不胜数。四字词语错两字的都有,然后一传十,十传百。唉。

像这类“电子版基础文化”的工作,应该由“国家语言文字工作委员会”组织专家来尽快完成才对。 如果有人大代表看到本帖,就提议一下吧。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3